\newpage
\subsubsection{La recherche des pré-miARN}
~\\
\paragraph{Les caractéristiques d'un pré-miARN}
~\\

Une tige boucle susceptible de contenir un microARN doit respecter des critères biologiques bien précises. Elle doit avoir:
\\
\begin{itemize}
 \item Une longueur totale minimale $min\_tot$ et maximale $max\_tot$ : $l\_tot$
  \item Une taille maximale pour la boucle terminale $max\_bt$: $l\_bt$
  \item Une taille minimale $min\_tige$ pour la première partie de la tige : $l\_tige$
  \item Un minimum de pourcentage $min\_perc$ de bases appariés sur le premier brin.
\end{itemize}
~\\


\paragraph{Les différentes forme d'une tige-boucle}
~\\

Jusqu'à présent on a vu les tiges boucles ayant une structure simple. Mais on a en réalité des formes beaucoup plus complexe. On a en plus du cas de base, la possibilité d'avoir une tige boucle dans une autre au niveau de la première ou seconde partie de cette dernière. De plus, dans le cas où on a un nombre de bases consécutives non appariées\footnote{Qu'on nomme bulge} assez grand (que ce soit sur la première ou deuxième partie de la tige) il va falloir considérer ces bases comme étant le début de la boucle terminale d'un pré-miARN. Des exemples sont donnés en figure \ref{struct_complexe}
\\
\\
\begin{figure}[h]
\begin{center}
\includegraphics[scale=0.5]{../imports/tige_complexe.png}
\caption{\label{struct_complexe} Exemple d'une structure complexe}
\end{center}
\end{figure}
\\
\\
\newpage
\begin{flushleft}
  \bf
  \underline{Le cas simple:}
\end{flushleft}
~\\

Ici pour le cas le plus simple, la recherche de pre-miARN est immédiate. Pour cela on commence à partir de la première base $idep$ de la strucutre appariée avec la base $bpidep$, puis on passe à la base suivante $i$. Si $bpi$ est la base appariée courante (appariement avec $i$ ), lorsqu'on à $bpi$ qui est inférieur à $i$ c'est qu'on est sur le deuxième brin. On peut alors savoir si on a un pre-miARN, en effet si $nb\_paired$ est le nombre de nucléotides appariés sur le premier brin alors:
\\
\begin{itemize}
 \item $l\_tot = bpidep - idep + 1$
  \item $l\_bt = i - bpi + 1$
  \item $l\_tige = bpi - idep +1$
  \item $perc = nb\_paired / l\_tige$ .
\end{itemize}
~\\

Si les critères biologiques sont vérifiés:
\\
\begin{itemize}
 \item $min\_tot < l\_tot < max\_tot$
  \item $l\_bt < max\_bt$
  \item $min\_tige < l\_tige < max\_tige$
  \item $min_perc < perc$ .
\end{itemize}
~\\

Alors la séquence entre les positions $idep$ et $bpidep$ est un precurseur de microARN.
\\
\\
\begin{figure}[h]
\begin{center}
\includegraphics[scale=0.7]{../imports/tige_simple.png}
\caption{\label{struct_arn} Schéma tige simple}
\end{center}
\end{figure}
\\
\\

\begin{flushleft}
  \bf
  \underline{Une tige avec une boucle terminale complexe}
\end{flushleft}
~\\

Il se peut qu'on ait une structure avec un certain nombre de bases consécutives non appariées. Si ce nombre est supérieur à 20, alors ces bases non appariées doivent être considérées comme le début de la boucle terminale de la tige. 

Dans ce cas on parcourt, comme pour le cas simple, la séquence à partir de la première base $idep$. Mais cette fois-ci on doit également mémoriser le couple dappariement précèdent du couple courant: $(ider,bpider)$ . Si on a $i-ider+1<21$\footnote{21 est la taille minimale d'une boucle terminale complexe} c'est qu'il soit possible qu'on ait un bulge de taille 20 et donc le début d'une boucle terminale. On vérifie alors dans le tableau des appariements si les nuclétotides entre les positions $ider$ et $i$ ne sont appariés à aucune base, si tel est le cas et si le nombre de base non libre entre $idep$ et $ider$ est $nb\_paired$ alors :
\\
\begin{itemize}
 \item $l\_tot = bpidep - idep + 1$
  \item $l\_bt = bpider - ider + 1 - 2 $ (\textit{les bases ider et bpider étant appariées on doit les enlever de la boucle terminale})
  \item $l\_tige = ider - idep +1$
  \item $perc = nb\_paired / l\_tige$ .
\end{itemize}
~\\

Si ces paramètres respectent les caractéristiques présentées plus haut alors entre les positions $idep$ et $bpidep$ on a un precurseur de microARN.

Il est possible, dans la suite de la séquence, d'avoir une autre tige-boucle candidat on met donc à jour $idep$ et $bpidep$ par les affectations: 
$idep \leftarrow i$ et $bpidep \leftarrow bpi$, et on réinitialise le nombre d'appariement.
\\
\\
\begin{figure}[h]
\begin{center}
\includegraphics[scale=0.7]{../imports/tige_bulge.png}
\caption{\label{struct_arn} Schéma boucle terminale complexe}
\end{center}
\end{figure}
~\\
\\
\begin{flushleft}
  \bf
  \underline{Une tige dans une autre}
\end{flushleft}
~\\

Pour ce dernier cas, il faut se dire qu'il serait possible de trouver un autre candidat lorsqu'on parcourt la structure, ce qui signifie que la structure courante présente une sous-structure candidate. Cela va se caractériser par le fait que la différence entre l'appariement courant et le dernier est supérieur à 6. Et entre la dernière position et la position courante on a potentiellement une tige (qui peut être simple ou complexe).

Pour ce faire, on doit, toujours de la même manière, partir de la première base $idep$ appariée avec $bpidep$. Si  entre la base appariée courante $bpi$ et la dernière base appariée on a un saut de plus de 6 nucléotides alors on doit alors regarder entre les positions $bpi+1$ et $bpider-1$ si on comptabilise un nombre d'appariement non nul c'est qu'on doit étendre la tige, sinon il s'agit de la fin de la tige, avec une boucle terminale donc supérieure à 6.

Si on trouve alors des appariement entre $bpi+1$ et $bpider-1$, il faut étendre la tige en modifiant la position de départ et de fin :  $idep \leftarrow i$ et $bpidep \leftarrow bpi$. Mais avant cela il ne faut pas oublier de vérifier si on n'a pas trouvé un candidat, en effet si $nb\_paired$ est le nombre d'appariement entre $idep$ et $ider$ alors: 
\\
\begin{itemize}
 \item $l\_tot = bpidep - idep + 1$
  \item $l\_bt = bpider - ider + 1 - 2 $ (\textit{les bases ider et bpider étant appariées on doit les enlever de la boucle terminale})
  \item $l\_tige = ider - idep +1$
  \item $perc = nb\_paired / l\_tige$ .
\end{itemize}
~\\

Si les critères biologiques sont vérifiés, alors on a un pré-miARN entre les positions $idep$ et $bpidep$. On aura dans ce cas-là aussi une boucle terminale complexe.
\\
\\
\begin{figure}[h]
\begin{center}
\includegraphics[scale=0.7]{../imports/tige_tige.png}
\caption{\label{struct_arn} Schéma d'une tige dans une autre}
\end{center}
\end{figure}
\\
\\

Ainsi il faut parcourir la matrice, utilisée pour traiter les redondances pour la recherche de tige boucle candidates de microARN. Si à une position $i,j$ on a l'indice d'une structure on effectue la recherche de pré-miARN entre les positions respectives $i$ et $j$ (resp. $idep$ et $bpidep$), en s'assurant de traiter les trois cas de tige vus plus haut. 

~\\

Cependant l'étude des cas n'est pas disjointe, en effet le dernier cas regroupe les deux premier d'un point de vue algorithmique.
